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摘要 : 物种 演化 时 间 估 算是 生命 演化 研究 的 重要 部 分 。 近 年 来 , 许多 研究 发 现 不 同 基 因 和 不 
同 物种 的 进化 速率 差异 显著 ,因此 需要 新 的 方法 对 进化 事件 发 生 时 间 进 行 重新 估计 。 为 了 对 
被 子 植物 演化 时 间 的 从 新 估计 ， 基 于 共享 多 倍 化 事件 或 共享 分 歧 事 件 应 该 有 共同 Ks 峰值 的 
理念 ， 建 立 了 基于 基因 组 数据 的 进化 速率 矫正 模型 ， 结 果 如 下 : CD 对 获取 Ks 分 布 三 种 
常见 的 方式 进行 了 比较 分 析 , 明确 了 通过 提取 共 线 性 区 块 上 Ks 值 的 中 位 数 的 方式 最 优 。(2) 
模拟 了 Ks 值 随时 间 累 积 系数 的 变化 过 程 下 的 Ks 分 布 。 当 假设 服从 正 态 分 布 时 ，Ks 分 
布 出 现 了 长 尾 现 象 。(3) 将 矫正 方法 在 被 子 植物 中 的 应 用 ， 发 现 不 同 谱系 的 被 子 植物 具有 
同步 的 辐射 进化 和 适应 性 进化 现象 。 而 且 被 子 植物 的 进化 速率 虽然 差异 显著 , 但 不 同 分 文 间 
的 进化 速率 仍 具 有 部 分 一 致 性 。 例 如， 木兰 类 植物 进化 速率 最 慢 ， 真 双子 叶 植 物 次 之 ,单子 
叶 植 物 进 化 速率 最 快 。 最 终 得 到 了 相对 可 靠 的 物种 的 演化 时 间 轴 , 为 植物 研究 提供 系统 发 育 
和 演化 的 支撑 。 
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Time scale of angiosperm evolution based on Ks distribution 
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Abstract: Estimating the time scale of species evolution is an important part of life evolution. It is 
found that there are significant differences in the evolution rate of different genes and species in 
recent years, which challenges the molecular clock hypothesis to a great extent. Therefore, new 
methods are needed to re-estimate the evolutionary events time. The whole genome sequence of 
angiosperms makes it possible to estimate the evolutionary time from the whole genome 
perspective. In order to re-estimate the evolution time of angiosperms, an evolution rate correction 
model based on genomic data is established according to the idea that shared polyploidy events or 
shared divergence events should have the same Ks peak. The results were as follows: (1) Three 
common ways to obtain Ks distribution were compared and analyzed, which showed that the best 
way was to extract the median of Ks values on collinear blocks. (2) The change process of Ks 
distribution was simulated with time accumulation coefficient v of Ks values. When v was 
assumed to obey the normal distribution, the Ks distribution had a long tail phenomenon. (3) The 
correction process was described in detail, which was conducive to the understanding and wide 
spread of this method. From the application of correction method in angiosperms, it was found 
that the Ks peak before correction was not linear with time, while the Ks peak after correction was 
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directly proportional to time, indicating that it is very necessary to estimate the time of species 
evolution events after correcting the Ks peak. It was also found that although the evolution rate of 
angiosperms was significantly different, the evolution rate between different branches was still 
partially consistent: Magnoliids had the slowest evolutionary rate, followed by Eudicots and 
Monocots. When the environment changed greatly, most species of different lineages of 
angiosperms had synchronous radial evolution and adaptive evolution. Finally, the model corrects 
angiosperms and established a relatively reliable angiosperm evolution time axis, which helps to 
understand the evolution process and model, especially to understand the phylogenetic 
relationship and the causes of diversity and provides phylogenetic and evolutionary support for 
plant research. 
Key words: Ks distribution, angiosperms, time correction, phylogenetic tree, evolutionary rate 
被 子 植物 的 起 源 和 早期 快速 演化 及 其 发 生 时 间 一 直 是 生物 学 的 研究 热点 。 当 前 估算 物 
种 演化 时 间 的 方法 主要 是 基于 分 子 钟 假 设 , 即 以 某 几 个 特定 类 群 的 化 石 时 间作 为 校正 点 , 然 
后 通过 部 分 基因 序列 间 的 相似 性 , 假设 不 同 的 物种 拥有 相同 或 相近 的 进化 速率 , 来 估算 系统 
发 育 树 上 某 一 节点 的 时 间 , 从 而 推断 出 该 类 群 的 起 源 时间 ( 唐 先 华 等 ,2002; Donoghue & Yang, 
2016; Luo etal., 2020) 。 然 而 ， 近 年 的 研究 表明 ， 不 同 物 种 的 分 子 钟 常常 具有 显著 差异 ， 
即 不 同 物种 的 进化 速率 有 显著 不 同 (Wang et al., 2015; Wang et al., 2017; Wang et al., 2018; 
Wang et al., 2019), 不 同年 代 也 具有 不 同 的 进化 速度 ( 罗 静 和 张 亚 平 , 2000; Smith & Donoghue, 
2008) 。 而 且 在 不 同 的 研究 中 ， 对 分 子 进化 速率 的 估算 有 很 大 的 差异 (Lanfear et al., 2010)。 
除 此 之 外 ， 引 入 的 化 石 时 间 对 估算 的 时 间 影响 很 大 ， 随 着 更 多 化 石 且 更 准确 的 年 份 测定 ,被 
子 植物 演化 的 时 间 尺 度 也 会 随 之 变动 (Hug & Roger, 2007; Wang et al., 2015; Silvestro et al., 
2021) 。 
基因 组 测序 揭示 了 历史 上 反复 的 多 倍 化 事件 Ren et al., 2018) ， 多 倍 化 事件 使 基因 组 
内 所 有 基因 发 生 重复 , 且 基 因 组 中 的 古老 同 源 区 域 常常 有 相当 数目 的 重复 基因 保留 下 来 , 形 
成 目前 基因 组 内 或 者 基因 组 间 的 共 线 性 同 源 基因 Jiao et al., 2011) 。 对 共 线 性 同 源 基因 的 
分 析 , 是 揭示 古代 的 多 倍 化 或 物种 分 歧 事件 并 推定 其 发 生 时 间 和 规模 的 重要 途径 。 多 倍 化 发 
生 后 植物 基因 组 常常 会 变 得 很 不 稳定 ， 进 化 速率 也 变 得 显著 不 同 。 由 于 减少 了 选择 性 约束 ， 
这 些 重复 基因 通常 以 更 快 的 速度 进化 (Wang et al., 2016)。 例 如 在 萌 芦 科 植 物 基因 组 的 研究 
中 ， 发 现 甜瓜 的 进化 速度 最 慢 ， 西 瓜 和 黄瓜 的 进化 速度 分 别 快 23.6% 和 27.4% (Wang et al., 


一 般 认 为 ， 同 义 替 换 率 (synonymous substitution rate, Ks) 往往 不 会 改变 氨基 酸 的 组 成 ， 
不 受 自然 选择 的 影响 。 因 此 ，Ks 分 布 常常 作为 判定 物种 历史 上 发 生 的 多 倍 化 或 物种 分 歧 事 
件 的 依据 CVanneste et al., 2013) 。 依 据 共 享 的 演化 事件 应 该 有 相同 的 Ks 峰值 ，Wang 等 人 
首次 提出 了 基于 Ks 峰值 的 矫正 方法 用 以 估算 物种 演化 的 时 间 尺 度 ， 得 到 了 其 他 研究 工作 者 
的 认可 ， 还 被 广泛 应 用 于 他 们 的 研究 中 (Zhuang et al., 2019; Shang et al., 2020; Song et al., 
2020; Yang et al., 2020; Song et al., 2021; Wang et al., 2021) 。 例 如 两 个 团队 分 别 对 睡莲 (Zhang 
et al., 2020a) FIZSE (Yang et al., 2020) 基因 组 分 析 ，Yang 等 人 通过 Ks 峰值 矫正 的 方式 估 
算 的 荧 实 古老 多 倍 化 (被 证 实 为 睡莲 目 共 享 ) 与 另外 的 团队 基于 睡莲 目的 转录 组 数据 估算 的 
时 间 尺 度 基 本 一 致 。 基 于 Ks 峰值 的 矫正 方法 中 ， 获 得 准确 的 Ks 峰 是 准确 估算 时 间 尺 度 的 
关键 。 然 而 ， 当 前 获取 Ks 分 布 的 方式 不 统一 而 且 常 第 珊 有 长 尾 现 象 〈Tang et al., 2008) 。 
为 何 Ks 分 布 会 有 长 尾 现象 ? 长 尾 现象 对 Ks 峰 是 否 有 重要 影响 等 问题 ， 也 尚未 有 清晰 的 表 
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An, CLA 400 余 种 被 子 植物 的 基因 组 得 到 不 同 水 平 的 测定 ， 便 于 在 全 基因 组 的 尺度 
上 理解 这 些 被 子 植物 的 演化 历程 (Kress et al., 2022) 。 全 基因 组 数据 能 有 效 消除 横向 基因 转 
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移 和 类 群 间 基 因 进 化 速率 差异 等 因素 对 系统 发 育 树 的 影响 。 因 此 , 急需 在 全 基因 组 数据 层面 
上 ， 利 用 新 的 方法 对 被 子 植物 的 演化 时 间 进 行 重 新 估计 。 该 文 拟 对 三 种 获取 Ks 分 布 的 方式 
进行 比较 ， 明 确 哪 种 方式 获得 的 Ks 峰值 更 接近 真实 情况 ; 对 于 Ks 分 布 中 常见 的 长 尾 现象 ， 
采用 模拟 仿真 的 方式 ,探究 出 现 长 尾 现象 的 原因 ;区 分 共享 多 倍 化 和 共享 早期 分 化 两 种 情况 ， 
创建 基于 全 基因 组 数据 的 Ks 分 布 矫正 模型 ， 对 44 个 代表 性 被 子 植物 基因 组 演化 事件 的 时 
间 尺 度 进行 重新 估计 , 得 到 相对 可 靠 的 被 子 植物 演化 时 间 轴 。 这 有 助 于 更 深层 地 了 解 被 子 植 
物 多 样 性 和 系统 发 育 以 及 被 子 植物 基因 组 的 进化 模式 。 
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1 材料 与 方法 
1.1 基因 组 数据 材料 

收集 44 个 高 质量 染色 体 水 平 的 被 子 植物 基因 组 (主要 来 自 NCBI 和 PHYTOZOME ) ， 
共 包 含 43 科 39 目 ( 表 1) 。 
1.2 方法 
1.2.1 共 线 性 分 析 
使 用 WGDI v0.5.3 (Sun et al., 2021) 软件 进行 共 线 性 分 析 。 首 先 ， 使 用 BLASTP 来 识 
别 基 因 组 内 或 基因 组 间 的 基因 相似 性 。 随后, 用 WGDI 软件 的 “-d” 子 程序 绘制 同 源 点 阵 图 ， 
并 运行 “-icl” 子 程序 获得 共 线 性 基因 。 
1.2.2 Ks 分 布 

Ks 分 布 主要 是 通过 WGDI 软件 完成 的 。 首 先 ， 使 用 WGDI 软件 的 “-ks” 子 程序 调用 
PAML (Yang, 2007) 软件 计算 共 线 性 基因 对 的 Ks 值 。 通 过 “-bi” 子 程序 整合 共 线 性 和 Ks 
值 的 结果 ， 并 使 用 WGDI 软件 的 “-bk” 子 程序 查看 共 线 基因 的 Ks 值 的 分 布 ， 结 果 以 点 图 
的 形式 展示 (图 1: AO 。 根 据 物 种 内 或 种 间 已 知 的 多 倍 化 或 分 歧 事件 ， 通 过 WGDI 的 “-c? 
子 程序 对 共 线 性 片段 进行 过 滤 ， 只 保留 多 倍 化 事件 或 分 歧 事件 产生 的 共 线 性 片段 。 然 后 ， 通 
it WGDI 的 “-kp” 子 程序 获取 Ks 分 布 (图 1: BO 。 最 后 ， 使 用 WGDI 中 的 “-pf” 子 程序 
对 不 同事 件 分 别 进行 拟 合并 获取 Ks 分 布 〈 图 1: ©) 。 
2 结果 与 分 析 
2.1 Ks 分 布 和 长 尾 现象 解析 

Ks 分 布 常常 用 来 判定 物种 历史 上 发 生 的 多 倍 化 或 物种 分 政事 件 的 依据 。 目 前 获取 Ks 
分 布 主要 有 三 种 方式 。 方 式 一 : 通过 OrthoMCL (Li et al., 2003) 等 聚 类 软件 获取 旁 系 同 源 
基因 对 ， 然 后 计算 这 些 同 源 基 因 对 的 Ks 值 并 绘制 Ks 分 布 图 。 方式 二 : 先进 行 基因 组 共 线 
性 分 析 ， 然 后 计算 共 线 性 基因 对 Ks 值 并 绘制 Ks 分 布 。 方 式 三 :在 方式 二 的 基础 上 ， 提 取 
线性 区 块 上 Ks 值 的 中 位 数 并 绘制 Ks 分 布 。 三 种 方式 中 ， 方 式 一 由 于 没有 共 线 性 分 析 ， 
所 获取 的 旁 系 同 源 基 因 对 常常 会 有 大 量 串联 重复 基因 从 而 影响 Ks 分 布 。 方式 二 和 三 都 经 过 
了 共 线 性 分 析 ， 当 把 共 线 性 区 块 《〈 长 度 大 于 5) 上 同 源 基因 对 的 Ks 值 以 点 图 的 形式 展示 出 
来 时 《〈 图 1: AO ， 这 里 以 水 稻 为 例 ， 可 以 看 到 大 部 分 由 绿色 的 点 组 成 的 片段 ， 例 如 8 号 与 
9 号 染色 体 ， 这 与 水 稻 近 期 的 一 次 多 倍 化 事件 相符 。Ks 点 图 中 大 部 分 点 的 颜色 相近 ， 说 明 
Ks 值 波动 很 小 。 对 共 线 性 区 域 的 Ks 值 的 中 位 数 〈 方 式 三 ) 、 平 均值 和 所 有 的 基因 对 (方式 
=) 进行 正 态 分 布 拟 合 (带宽 为 0.01，homo 范围 0.3-1) (图 2: BO ， 可 以 看 到 方式 二 并 
没有 产生 明显 的 峰 ， 而 且 Ks 分 布 整 体 带 有 长 长 的 尾巴 。 方式 三 和 区 块 的 平均 值 的 Ks 分 布 
有 明显 峰值 ， 数 据 更 为 集中 。 由 于 中 位 数 是 对 总 体 中 心 很 好 的 估计 ， 且 稳健 性 更 强 ， 中 位 数 
的 峰值 颜色 和 Ks 点 图 的 颜色 更 为 接近 ， 因 此 区 块 的 Ks 值 的 中 位 数 更 接近 Ks 真正 的 峰值 ， 
对 方式 三 的 Ks 分 布 按照 正 态 分 布 拟 合 来 提取 Ks 峰值 (图 1: © 。 
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A. Synteny blocks of the Oryza sativa genome; B. Fitted distribution of Ks values for synteny blocks; C. Kernel 
density of Ks values for synteny blocks. 
图 1 Ks 分布 
Fig.1 Ks distribution 


为 了 进一步 解析 长 尾 现象 ， 模 拟 了 Ks 分 布 随 进化 速率 的 演变 过 程 。 假 设 最 初 的 Ks 分 
布 服从 正 态 分 布 忆 ~ N(u,0^). RPR ui (峰值 》 和 标准 差 o: 为 常数 。 分 子 钟 理 论 认为 


基因 的 进化 速率 是 相对 恒定 的 ， 因 此 定义 (v >1)， 代 表 Ks 值 的 时 间 累 积 系数 ， 表 示 初 始 
Ks 值 随时 间 演 化 不 断 累积 ， 模 拟 真 实情 况 下 的 恒定 进化 速率 。 而 其 他 研究 表明 分 子 钟 也 并 
非 等 速 进 行 ， 同 时 假设 也 服从 正 态 分 布艺 ~ N(A ,ca 2) ， 对 这 两 种 假设 分 别 进行 了 数据 


仿真 模拟 。Ks 值 随 着 时 间 的 推移 进行 迭代 为 六 eR ENN. 4v 为 常数 值 时 ， 
X =X*y" 


当 Vy 服 从 正 态 分 布 时 ， 
X-X*X/ 


当 假 设 Ks 值 的 时 间 累 积 系数 y 为 一 个 常数 值 时 , 设置 假设 的 Ks 29 X ~ No), 


依据 Ks 分 布 数 据 特征 ， 设 定 wUL= 0.2 ，G=0.01，Yv=1.02 ，7=100 。 每 迭代 10 次 ， 绘 


制 Ks 分 布 结果 (图 2: AO 。 随 着 进化 事件 的 推移 ，Ks 峰值 也 逐渐 变 大 ，Ks 分 布依 旧 完 美 
符合 正 态 分 布 且 没有 明显 的 长 尾 分 布 现象 。 
当 假 设 Ks 值 的 时 间 累 积 系数 服从 正 态 分 布 时 ， 最 初 设置 假设 的 Ks 分 布 为 


X,~N(u,,0,7)> KH uw =0.2, o =0.01, 4, =1.02, o, =0.01, n=100. 每 迭代 
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10 次 ， 绘 制 Ks 分 布 结果 〈 图 2: BO 。 随 着 进化 事件 的 推移 ，Ks 峰值 也 逐渐 变 大 ，Ks 分 布 
也 不 再 是 正 态 分 布 ， 并 带 有 明显 的 长 尾 现象 。 这 种 假设 所 得 到 的 结果 更 接近 于 真实 情况 ， 


此 ,基因 的 进化 速率 不 是 相对 恒定 的 ， 它 可 能 并 非 等 速 进行 ， 而 是 在 不 同年 代 具 有 不 同 的 i 


化 速度 ， 这 可 能 也 符合 正 态 分 布 。 对 模拟 的 Ks 分 布 再 次 通过 高 斯 拟 合 获取 峰值 时 ， 发 现 


Ks 峰值 与 进化 速率 匀速 时 的 没有 明显 差异 〈 表 2) 。 因 


Ks 峰值 的 影响 较 小 。 


此 ，Ks 分 布 中 长 尾 现象 对 提取 到 的 


频率 Frequency 


一 一 初始 Origina 
— — YO 10times 


— — 20% 20times 


一 一 40% 40 times 


一 一 90% 90 times 


0.00 0.25 


频率 Frequency 


0.50 0.75 1.00 125 1.50 135 2.00 
同 义 突变 率 Ks 


一 一 初始 Original 


一 一 40 次 40times 


一 一 一 100 次 100 times 


30%K 30 times 


50 次 50 times 
60 次 60 times 
70 次 70 times 


一 一 80 次 80 times 


100 次 100 times 


10%K 10times 
一 一 20K 20 times 


30 次 30 times 


SOX 50 times 
60 次 60 times 
70 次 70 times 
80 次 80 times 


90 次 90 times 


1 


0.50 0.75 1.00 1.25 1.50 1.75 2.00 


同 义 突变 率 Ks 


A. Ks 分 布 在 恒定 进化 速率 下 的 模拟 ，B. Ks 分 布 在 进化 速率 服从 正 态 分 布 的 模拟 。 


A. Simulation of Ks distribution at a constant evolution rate; B. Simulation of Ks distribution under a normal 


distribution of evolution rates. 


图 


2 Ks 分 布 在 不 同 进化 速率 下 的 模拟 结果 


Fig.2 Simulation results of Ks distribution at different evolution rates 


表 2 不 同 进化 速率 模拟 下 的 Ks 峰值 


Table 2 Ks peaks under simulations at different evolution rates 


迭代 次 数 匀速 分 布 正 态 分 布 差异 
Number of iterations Uniform distribution Normal distribution Difference 

0 0.200 0.200 0.000 

10 0.244 0.243 -0.001 

20 0.297 0.297 0.000 

30 0.362 0.355 -0.007 


40 
50 
60 
70 
80 
90 
100 


0.442 
0.538 
0.656 
0.800 
0.975 
1.189 
1.449 


0.431 0.010 
0.531 0.008 
0.650 0.006 
0.792 -0.008 
0.961 -0.014 
1.180 0.009 
1.442 0.007 


2.2 Ks 分 布 矫正 方法 
被 子 植物 基因 组 常常 


享 事件 的 Ks 峰 矫 正 到 一 起 。 根据 
享 分 化 两 种 情况 。 


如 果 物 种 A、B 存在 共享 的 多 倍 化 事件 ， - 
应 该 是 相同 的 ，Ks 峰值 也 应 该 是 相等 的 (图 3: 


BU Ks,, =KSpp> 


经 历 不 止 一 次 多 倍 化 事件 , | 
导致 共享 的 多 倍 化 事件 的 Ks 峰值 也 大 不 相同 。 而 Ks 分 布 矫 正方 法 的 核心 理念 就 是 


于 不 同 物 种 的 进化 速率 显著 不 同 , 就 
将 这 些 


共享 事件 的 不 同 ，Ks 分 布 矫 正方 法 又 分 为 共享 多 倍 化 和 


这 次 多 倍 化 事件 在 不 同 物 
。 黄 色 方 块 代表 两 个 物 


对 应 的 时 间 范 围 为 物种 A、B 从 多 倍 化 事件 到 当前 的 时 间 点 (绿色 的 大 括 


' 中 发 生 的 时 间 
' 共 享 的 多 倍 化 ， 


号 ) 。 由 于 物种 不 同 的 进化 速率 , 现实 情况 下 的 Ks ,, 和 Ks, 并 不 相等 。 假 设 多 倍 化 事件 之 


后 物种 A 和 B 有 各 


的 进化 速率 分 别 为 vy 和 vs » 


件 到 分 歧 点 0O， 物 种 A. B 的 祖先 


恢复 到 vy 就 要 乘 以 它 的 矫正 系数 为 4,= 一 。 


物种 A、B 间 分 化 的 Ks 矫正 后 为 大 S5 z Ks AA, 


I 有 的 进化 速率 为 v 。 


同 理 ， 物 


V4 


O 是 物种 A、B 的 分 化 节点 ， 从 多 倍 化 寻 


dg 


那么 ， 物 


' A 的 进化 速率 vy, 要 想 


B 的 矫正 系数 为 1 = 一 。 因 而 ， 


Vg 


(Yang et al., 2020) 。 


如 果 两 个 物 
外 类 和 群 来 辅助 矫正 〈 图 3: B) 。 


Ks 峰值 也 应 该 相等 ， 即 Ks = Ksey Kspy =KSpg 0 


1A、B 不 存在 共享 的 多 倍 化 事件 但 存在 共享 的 早期 分 化 事件 时 ， 通 过 寻找 
物种 C、D、E 是 外 类 和 群 ， 
种 A、B 的 祖先 分 化 ， 所 以 物种 C 与 A、B 间 的 Ks 峰值 应 该 相等 ， 物 


物种 C 和 DD 的 祖先 在 P 点 与 物 


ID 与 A、B 间 的 
同样 ， 由 于 物种 间 不 同 的 进化 速率 ， 


现实 情况 下 它们 大 多 是 不 相等 的 。 按 照 前 面 的 假设 ， 
及 Scoreeron * Kse ACA, = 天 Sci44 =|, 即 Ay _ Kscs 
KScp correction KScpAcAg Kscshs Ay 天 Sci 
同 理 ， 
KS p, correction... Ks pA, E Ks, =], HJ 勾 _ Ksps . 
KS pp comection KSppApAg Kspshs Aj KSp, 
可 以 发 现 ， 当 选取 的 外 类 群 越 多 ， 获 取 的 4, MA, 的 关系 越 准确 。 最 后 取 平 均值 表示 它们 之 
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间 的 关系 色 —mean( 
A, 


<5 吕 
时 间 
A. 共享 多 倍 化 事件 ; 
A. Shared polyploidy 


ChinaXiv 合 作 期 


大 Scp Ksps 


, gee 
Sca Ksp, 


时 间 


B. 共享 早期 分 化 。 
events; B. Shared early divergence. 
图 3 Ks 分 布 矫正 方法 的 原理 
Fig.3 Principle of the Ks distribution correction method 


2. 3 被 子 植物 系统 发 育 树 时 间 矫 正 


目前 , 很 多 用 系统 发 育 树 的 方法 二 


纪 225 百 万 年 至 240 百 万 年 前 (Magall6n, 2010) ， 这 与 起 传粉 作用 的 核心 植 食性 


侨 测 被 子 植物 的 演化 时 间 ， 认 为 被 子 植物 的 起 源 为 三 县 


E AERA H Æ 


讨论 它 和 睡莲 目的 关系 , 并 且 认为 五 大 分 支 的 分 化 时 间 尺 度 在 同一 个 时 间 范 围 内 。 
真 双 子叶 植物 共享 的 y 事件 ， 时 间 范 围 为 115-130 百 万 年 (Million years ago, Mya) ， 对 44 


个 被 子 植物 基因 组 K1) d 


植物 在 130 BAA 


虫 的 起 源 时 间 ( 约 230 百 万 年 前 ) 一 致 (Li et al., 2019) 。 由 于 无 油 樟 目 和 睡莲 目 、 核 心 被 
子 植 物 五 大 分 支 之 间 的 关系 仍然 没有 完全 解析 , 已 有 多 个 证 据 暗 示 核 心 被 子 植物 祖先 可 能 发 
生 了 快速 辐射 分 化 (Yang etal., 2020) 。 因 此 ， 在 矫正 过 程 中 ， 以 无 油 樟 目 


为 作为 参考 ， 不 


基于 核心 


行 了 时 间 尺 度 矫 正 〈 图 4) 。 从 矫正 后 的 时 间 尺 度 来 看 ， 被 子 


FE 前 附近 ,单子 叶 植 物 、 真 双子 叶 植 物 、 木 兰 类 植物 祖先 都 发 生 了 快速 辐射 


进化 ， 与 先前 的 结 


被 子 植物 发 生 了 的 多 倍 化 事 们 


不 是 随机 分 布 的 结论 一 致 (Wu et al., 2020) 。 


mi 


论 一 臻 (Zhang etal., 2020b) . UES, FER AH C130 百 万 年 ) 时 期 ， 
白垩 纪 - 古 新 世 《〈K-Pg) 边界 时 期 〈66 百 万 年 ) 和 中 新 世 (20 百 万 年 ， 靠 近 冰 川 期 ) 很 多 
,与 先前 的 研究 发 现 WGD 的 时 间 在 被 子 植物 的 系统 发 育 中 并 


管 不 同 物种 的 进化 速率 数值 显著 不 同 , 但 是 同一 类 群 中 的 进化 速率 往往 具有 部 分 一 致 


性 。 由 矫正 方法 可 知 ， 矫 正 后 的 Ks 峰 应 该 相等 。 因 此 ，Ks 峰值 越 大 ， 表 明 进 化 速率 越 快 。 


对 木兰 类 植物 、 真 双子 叶 植物 和 单子 叶 植 物 与 无 油 樟 的 Ks 峰值 的 比较 发 现 , 木兰 类 植物 (大 
多 数 为 木 本 ) 进化 速率 最 慢 ， 真 双子 叶 植物 〈 大 多 数 为 灌木 ) 次 之 ， 单 子叶 植物 (大 多 数 草 


AS) 进化 速率 最 快 ( 表 3) , RBA 


FE 生 木 本 植物 比 草本 植物 的 分 子 进化 速率 快 的 结论 相符 


(Lanfear et al., 2013)。 此 外 ,对 多 倍 化 事件 发 生 的 时 间 与 矫正 前 后 的 Ks 峰值 比较 发 现 (图 
5) ， 矫 正 前 的 Ks 峰值 与 时 间 并 不 是 线性 关系 。 随 着 Ks 峰值 的 增 大 ， 多 倍 化 事件 发 生 的 时 
而 矫正 后 的 Ks 峰值 与 时 间 成 正比 ， 因 此 ， 对 Ks 峰值 进行 矫正 之 后 再 估 
算 物 种 演化 事件 的 时 间 是 十 分 必要 的 。 


间 并 没有 更 古老 。 


C— 
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图 4 ”时间 矫 正 后 的 被 子 植物 系统 发 育 树 


Fig.4 Angiosperm phylogenetic tree after time correction 


1 
0 百 万 年 (Mya) 


时 间 Time (Mya) 


| 
0 0.5 1 L5 2 2.5 
同 义 突变 率 Ks 


o 矫正 前 Ks 峰值 Ks peaks before correction ® 矫正 后 Ks 峰值 Ks peaks after correction 


图 5 矫正 前 后 Ks 峰值 与 时 间 的 关系 
Fig.5 Relationship between Ks peaks and time before and after correction 


真 双子 叶 植 物 
Eudicots 


dra H 


Ceratophy!lales. 


木兰 类 植物 
Magnoliids. 


eH 
Chloranthales 


表 1 研究 所 用 的 44 个 被 子 植物 及 基因 组 数据 来 源 
Table ] List ofthe 44 angiosperms involved and the genome data sources 
物种 H 科 数据 来 源 
Species Order Family Data source 
EST. JG E E 无 油 樟 科 https://ftp.ncbi.nlm.nih.gov/geno 
dm resina Amborellal Amborell mes/all/GCF/000/471/905/GCF _ 
mborella trichopoda mborellales orellaceae 000471905.2 AMTRI.0/ 
蓝 星 睡 莲 HEE H HEEE} https://phytozome-next.jgi.doe.g 
Nymphaea colorata Nymphaeales Nymphaeaceae ov/info/Ncolorata vl 2 
RS3E WX 木兰 目 木兰 科 https://www.ncbi.nlm.nih.gov/ge 
Liriodendron chinense Magnoliales Magnoliaceae nome/45466 
Hi 榜 目 樟 科 https://www.ncbi.nlm.nih.gov/ge 
Cinnamomum kanehirae Laurales Lauraceae nome/57158 
PERET 胡椒 目 马 兜 铃 科 https://ngdc.cncb.ac.cn/search/? 
; : ; : . : dbId=gwh&q=Aristolochia&pag 
Aristolochia fimbriata Piperales Aristolochiaceae — , | 
jp 楼 目 蜡 梅 科 https://www.ncbi.nlm.nih.gov/ge 
Chi h licifoli Cal th nome/82066?genome_assembly 
imonanthus salicifolius Laurales alycanthaceae _id=1651656 
紫 萍 泽 泻 目 天 南星 科 https://data.j gi.doe.gov/refine-do 
Spirodela polyrhi : Ar wnload/phytozome?organism=S 
pirodela polyrhiza Alismatales aceae polyrhiza&expanded-290 
水 稻 不 本 目 不 本 科 https://phytozome-next.jgi.doe.g 
Oryza sativa Poales Poaceae ov/info/Osativa_v7_0 
WE AA A 凤梨 科 https://phytozome-next.jgi.doe.g 
Ananas comosus Poales Bromeliaceae ov/info/Acomosus_v3 
椰子 棕榈 目 棕榈 科 The genome draft of coconut 
Cocos nucifera Arecales Arecaceae (Cocos nucifera) 
油 标 棕榈 目 棕榈 科 https://ftp.ncbi.nlm.nih.gov/geno 
Elaeis guineensis Arecales Arecaceae mes/all/GCF/000/442/705/ 
qi Wu BER https://www.ncbi.nlm.nih.gov/ge 
RE 
uc - "M iu nome/tetm=HE8 13975%E2%8 
usa acuminata ingiberales usaceae 0°%93HE8 13985 
E A fit AMA H 兰 科 https:Wwww.ncbi.nlm.nih.gov/ge 
Dendrobium chrysotoxum Asparagales Orchidaceae nome/41833 
、 天 门 冬 目 天 门 冬 科 https://datadryad.org/stash/datas 
文生 et/doi:10.5061/dryad.1c59zw3r 
Asparagus setaceus Asparagales Asparagaceae a 
金鱼 党 T fa ie H 金鱼 藻 科 https://genomevolution.org/CoG 


Ceratophyllum demersum 


Ceratophyllales Ceratophyllaceae 


e/GenomelInfo.pl? gid=56569 


she 


XE 
Nelumbo nucifera 


昆 栏 树 


Trochodendron aralioides 


GA BESS 


Aquilegia coerulea 


油 蜡 树 


Simmondsia chinensis 


rp AE p p 


Actinidia chinensis 


ELAS 


Rhododendron simsii 


TH BA 


Olea europaea 


Ipomoea trifida 


中 粒 咖啡 
Coffea canephora 


红 花 


Carthamus tinctorius 


芹菜 
Apium graveolens 


GES 


Vitis vinifera 


时 黄瓜 


Cucumis hystrix 


So 
菜豆 


Phaseolus vulgaris 


LEY. 
Tripterygium wilfordii 


苹果 
Malus domestica 


山 龙 眼目 EF} 
Proteales Nelumbonaceae 
昆 栏 树 目 昆 栏 树 科 
TrochodendralesTrochodendraceae 
RH ERF 
Ranunculales Ranunculaceae 
石竹 目 油 蜡 树 科 
Caryophyllales Simmondsiaceae 
杜 鹏 花 目 TA CRI 
Ericales Actinidiaceae 
TESTE H FLAS AERE 
Ericales Ericaceae 

EJE H AURI 
Lamiales Oleaceae 

3uH 旋 花 科 
Solanales Convolvulaceae 
龙 胆 目 py LB} 
Gentianales Rubiaceae 

49 H AR 
Asterales Asteraceae 
4JEH 伞 形 科 
Apiales Apiaceae 

葡萄 目 葡萄 科 
Vitales Vitaceae 

ae H SPUR 
Cucurbitales Cucurbitaceae 
GH 豆 科 

Fabales Fabaceae 
PAH LAF Bt 
Celastrales Celastraceae 
LE BR 
Rosales Rosaceae 


https://ftp.ncbi.nlm.nih.gov/geno 
mes/all/GCF/000/365/185/GCF . 
000365185.1 Chinese Lotus 1. 


http://gigadb.org/dataset/view/id 
/100657/File page/5 


https://data.jgi.doe.gov/refine-do 
wnload/phytozome?organism-A 
coerulea&expanded-322 


https://ngdc.cncb.ac.cn/search/? 
dbId=gwh&q=GWHAASQ0000 
0000 


ftp://www.whiteflygenomics.org 


/pub/kiwifruit/A_chinensis/Red5 
/v1.0/Red5_genome_v1.0.fa.gz 


https://www.ncbi.nlm.nih.gov/ge 
nome?LinkName=bioproject_ge 
nome&from_uid=588298 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term=Olea+europaea 


https://datadryad.org/stash/datas 
et/doi:10.5061/dryad.b9m61cg 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term=Coffea+canephora 


https://safflower.scuec.edu.cn/do 
wnload.html 


http://celerydb.bio2db.com 


http://www.grapegenomics.com/ 
pages/VvCabSauv/download.ph 
p 

https://figshare.com/articles/data 


set/Genome assembly of Cucu 
mis hystrix/13377671 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term=Phaseolus+vulgaris 


https://www.ncbi.nlm.nih.gov/ge 
nome/12874 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term=Malus+domestica 


欧洲 大 叶 杨 


Populus trichocarpa 


TERME 
Betula pendula 


杨桃 


Averrhoa carambola 


ap up 


Theobroma cacao 


X 
Eucalyptus grandis 


DEP 


Acer yangbiense 


HE 


Davidia involucrata 


伯乐 树 


Bretschneidera sinensis 


连 香 树 


Cercidiphyllum japonicum 


PES xn 


Chloranthus sessilifolius 


By 
Dioscorea alata 


ER 


Acanthochlamys bracteata 


演 南 黄杨 


Buxus austroyunnanensis 


金 虎尾 目 杨柳 科 
Malpighiales Salicaceae 

壳 斗 目 桦木 科 
Fagales Betulaceae 
REX Et H REA ER} 
Oxalidales Oxalidaceae 
i H a zl 
Malvales Malvaceae 
Pkaz oe H 桃 金 娘 科 
Myrtales Myrtaceae 
TET H 无 患 子 科 
Sapindales Sapindaceae 
URK H 蓝 果 树 科 
Cornales Nyssaceae 

十 字 花 目 o BURNER 
Brassicales Akaniaceae 
EHHH 连 香 树 科 
Saxifragales Cercidiphyllaceae 
SRA ě SRA 
Chloranthales Chloranthaceae 
XH E EXER 
Dioscoreales Dioscoreaceae 
ge UM H JIA EB 
Pandanales Velloziaceae 
黄杨 目 黄杨 科 
Buxales Buxaceae 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term-Populus-trichocarp 
a 


https://genomevolution.org/CoG 
e/GenomelInfo.pl? gid=35080 


https://ngdc.cncb.ac.cn/search/? 
dbId=gwh&q=GWHABKE0000 
0000 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term=Theobroma+cacao 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term=Eucalyptus+grandi 
S 


http://gigadb.org/dataset/100610 


https://ngdc.cncb.ac.cn/search/? 
dbId=gwh&q=%20PRJCA0017 
21 &page=1 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term=GCA_018105755.1 


https://doi.org/10.1111/nph.1679 
8 


https://github.com/yongzhiyang 
2012/Chloranthus-sessilifolius-g 
enome/tree/main/Annotation 


https://phytozome-next.jgi.doe.g 
ov/info/Dalata v2 1 


https://www.ncbi.nlm.nih.gov/ge 
nome/?term-PRJNA 703828 


https://datadryad.org/stash/datas 
et/doi:10.5061/dryad.cjsxksn6d 


表 3 部 分 核心 被 子 植物 与 无 油 樟 之 间 的 Ks 峰值 


Table 3 Ks peaks between some species of Mesangiospermae and Amborella trichopoda 


核心 被 子 植物 物种 峰值 平均 值 
Mesangiospermae Species Ks peaks Average values 
昆 栏 树 
- 1.671 
真 双 子叶 植物 Trochodendron aralioides Lai 
Eudicot XE ` 
udicots ES T 


Cercidiphyllum japonicum 


演 南 黄 杨 1.750 
Buxus austroyunnanensis 
il 4] 
Vitis vinifera rem 
WAZ WLFB AE SE 
Fn 1.789 
Aquilegia coerulea 
RE ZEHK 
Liriodendron chinense LRA 
兰 类 i 
木兰 类 植物 "FRE 1.642 1.651 
Magnoliids Cinnamomum kanehirae 
Ajo dg 1.684 
Chimonanthus salicifolius ` 
水 稻 2.273 
Oryza sativa 
b 
AE 2210 
c Spirodela polyrhiza 
< 名 了 1.834 
单子 叶 植 物 Cocos nucifera 2.082 
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参 
25 1.950 


Dioscorea alata 


3 讨论 与 结论 


长 期 以 来 ,估算 被 子 植物 演化 的 时 间 尺 度 主 要 是 基于 分 子 钟 假设 ,然而 分 子 进化 异 速 现 
象 的 广泛 存在 严重 影响 其 准确 性 ，Wang 等 人 提出 的 基于 Ks 分 布 的 矫正 方法 ， 获 得 了 令 人 
P 信服 的 时 间 尺 度 。 该 文 对 获取 Ks 分 布 三 种 常见 的 方式 进行 了 比较 分 析 ， 明 确 了 通过 提取 共 
FI 线性 区 块 上 Ks 值 的 中 位 数 更 能 代表 真实 的 Ks 峰值 。 还 进一步 解析 Ks 分 布 中 常见 的 长 尾 现 

象 ， 模 拟 结 果 表 明基 因 的 进化 速率 不 是 相对 恒定 的 ， 它 并 非 等 速 进行 。 当 假设 进化 速率 不 是 
相对 恒定 的 ， 而 是 符合 正 态 分 布 的 时 候 ，Ks 分 布 出 现 了 有 明显 的 长 尾 现象 ， 但 这 并 不 影响 
提取 到 的 Ks 峰值 的 准确 性 。 先 前 的 研究 表明 ， 当 Ks 值 大 于 1 时 ， 容 易 受到 饱和 效应 的 影 
啊 ， 而 且 随 着 Ks 值 增 大 ， 这 种 效应 越 明 显 (Vanneste et al., 2013) 。 模 拟 的 Ks 峰值 范围 接 
近 于 1， 随 着 Ks 峰值 增 大 ， 估 计 的 Ks 峰值 可 能 会 受到 饱和 效应 的 影响 。 

本 研究 还 详细 描述 了 基于 Ks 峰值 的 矫正 方法 的 矫正 过 程 。 先 前 的 研究 只 对 共享 多 倍 化 
和 共享 早期 分 化 两 种 情况 分 开 进 行 了 描述 ， 这 是 首次 全 面 的 描述 ， 有 助 于 深入 理解 和 传播 。 
基于 该 方法 ， 还 对 44 个 高 质量 的 被 子 植物 基因 组 演化 事件 的 时 间 尺 度 进行 了 重新 估计 ， 估 
计 结 果 与 近期 发 表 的 时 间 尺 度 基 本 一 致 (Li et al., 2019; Wu et al., 2020) 。 结 果 还 表明 被 子 
植物 基因 组 的 进化 速率 差异 显著 , 但 不 同 分 支 间 的 进化 速率 仍 具 有 一 致 性 。 而 且 不 同 谱系 的 
被 子 植物 具有 同步 的 辐射 进化 和 适应 性 进化 现象 。 随 着 更 多 高 质量 的 被 子 植物 基因 组 的 公布 
和 有 效 化 石 年 份 的 准确 测定 , 被 子 植物 演化 的 时 间 尺 度 会 越 来 越 清晰 , 更 有 利于 植物 系统 发 
育 的 构建 和 更 深层 次 的 理解 物种 的 演化 历程 。 
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